PROJECT リッジアイの現場で使えるAI開発事例

マルチモーダルAIの活用

生成AIコンサルティング・開発サービス

Ridge-iのマルチモーダルAIは、画像・動画・音声・テキスト・数値など複数の形式のデータを統合的に処理することで、単一のAIでは解けない複雑なビジネス課題に応えるAIソリューションです。 20を超えるAI技術、カメラ・LiDAR等のセンシング技術、クラウドからエッジまでの計算環境を掛け合わせることで、人間の判断・作業を再現する実用性の高いソリューションを提供します。

マルチモーダルAIとは

画像・動画・音声・テキスト・数値など、複数の形式(モーダル)のデータを統合的に処理・理解するAIです。単一モーダルのAIが1種類のデータしか扱えないのに対し、マルチモーダルAIは複数のデータを相互補完的に扱うことで、現実世界の複雑な判断により近い処理を可能にします。

 

Ridge-iの強み ― 3要素の掛け合わせ

マルチモーダルAIを実ビジネスで機能させるには、「扱えるデータの幅」「AI技術の選択肢」「実装環境の柔軟性」の3つが揃っていることが重要です。Ridge-iはこの3要素を掛け合わせて、実用性の高いソリューションを実現します。

  • 多様なデータへの対応

画像、動画、音声、テキスト、数値に加え、LiDAR(3D点群)や振動センサなど、多様なデータを解析対象とします。

  • 20を超えるAI技術

物体検出、変化検知、画像加工から、需要予測、生成AI(RAG・ファインチューニング)まで幅広い技術を保有し、課題に応じて最適な技術を組み合わせます。

  • 現場に強い計算環境

クラウドだけでなく、工場やロボットアームなどの現場環境への実装や、APIによる外部システム連携にも柔軟に対応します。

 

マルチモーダルAIの活用例

  • プラント運転の自動化・高度化

組み合わせ:監視カメラ映像 × 運転センサデータ(温度・圧力・流量等)

プラント内の状況を捉える監視カメラ映像と、運転状況を示す各種センサデータを統合的に解析し、現状を正確に把握します。その上で、運転条件として最適な選択肢をオペレーターに提示。熟練者の経験に依存していた判断を支援し、プラント運転の自動化・高度化に貢献します。

  • 製造業における官能検査の自動化

組み合わせ:カメラ画像 × センサデータ × 人の感覚に沿った評価軸

これまで熟練検査員の目や感覚に頼っていた官能検査を、カメラ画像とセンサデータの組み合わせで再現します。人の感覚に合致する評価軸をあらかじめ定義し、対象がその軸上のどこに位置するかを数値として出力。検査の自動化と判定基準の標準化を同時に実現します。

  • 図表を含む文書の解釈と検索(マルチモーダル生成AI)

組み合わせ:テキスト × 表 × 図・画像

社内文書や業務レポートには、文字情報だけでなく表や図も多く含まれます。テキストのみを扱う生成AIでは取りこぼしてしまうこうした情報を、表や図もあわせて理解・参照できる生成AI環境を構築。複雑な資料に対しても、ユーザーの意図に沿った検索と解釈を可能にします。